pandas 读取excel文件

您所在的位置：网站首页 › read excel参数 › pandas 读取excel文件

pandas 读取excel文件

2023-09-17 10:01| 来源: 网络整理| 查看: 265

pandas 读取excel文件一 read_excel() 的基本用法二 read_excel() 的常用的参数:三示例 1. IO：路径2. sheet_name：指定工作表名3. header ：指定标题行4. names：指定列名5. index_col: 指定列索引6. skiprows：跳过指定行数的数据7. skipfooter：省略从尾部的行数据8.dtype 指定某些列的数据类型

pandas 读取excel文件使用的是 read_excel方法。本文将详细解析read_excel方法的常用参数，以及实际的使用示例

一 read_excel() 的基本用法import pandas as pd file_name = 'xxx.xlsx' pd.read_excel(file_name)

Jetbrains全家桶1年46，售后保障稳定

二 read_excel() 的常用的参数: io: excel路径可以是文件路径，类文件对象，文件路径对象等。 sheet_name=0: 访问指定excel某张工作表。sheet_name可以是str, int, list 或 None类型，默认值是0。 str类型是直接指定工作表的名称 int类型是指定从0开始的工作表的索引，所以sheelt_name默认值是0，即第一个工作表。 list类型是多个索引或工作表名构成的list，指定多个工作表。 None类型，访问所有的工作表 sheet_name=0: 得到的是第1个sheet的DataFrame类型的数据 sheet_name=2: 得到的是第3个sheet的DataFrame类型的数据 sheet_name=‘Test1’: 得到的是名为’Test1’的sheet的DataFrame类型的数据 sheet_name=[0, 3, ‘Test5’]: 得到的是第1个，第4个和名为Test5 的工作表作为DataFrame类型的数据的字典。 header=0：header是标题行，通过指定具体的行索引，将该行作为数据的标题行，也就是整个数据的列名。默认首行数据（0-index）作为标题行，如果传入的是一个整数列表，那这些行将组合成一个多级列索引。没有标题行使用header=None。 name=None：传入一列类数组类型的数据，用来作为数据的列名。如果文件数据不包含标题行，要显式的指出header=None。 skiprows：int类型，类列表类型或可调函数。要跳过的行号(0索引)或文件开头要跳过的行数(int)。如果可调用，可调用函数将根据行索引进行计算，如果应该跳过行则返回True，否则返回False。一个有效的可调用参数的例子是lambda x: x in [0, 1, 2]。 skipfooter=0: int类型，默认0。自下而上，从尾部指定跳过行数的数据。 usecols=None: 指定要使用的列，如果没有默认解析所有的列。 index_col=None: int或元素都是int的列表，将某列的数据作为DataFrame的行标签，如果传递了一个列表，这些列将被组合成一个多索引，如果使用usecols选择的子集，index_col将基于该子集。 squeeze=False, 布尔值，默认False。如果解析的数据只有一列，返回一个Series。 dtype=None: 指定某列的数据类型，可以使类型名或一个对应列名与类型的字典，例 {‘A’: np.int64, ‘B’: str} nrows=None: int类型，默认None。只解析指定行数的数据。三示例

如图是演示使用的excel文件，它包含5张工作表。

在这里插入图片描述1. IO：路径

举一个IO为文件对象的例子，有些时候file文件路径的包含较复杂的中文字符串时，pandas 可能会解析文件路径失败，可以使用文件对象来解决。

file = 'xxxx.xlsx' f = open(file, 'rb') df = pd.read_excel(f, sheet_name='Sheet1') f.close() # 没有使用with的话，记得要手动释放。 # ------------- with模式 ------------------- with open(file, 'rb') as f: df = pd.read_excel(f, sheet_name='Sheet1')2. sheet_name：指定工作表名

sheet_name=‘Sheet’，指定解析名为”Sheet1″的工作表。返回一个DataFrame类型的数据。

df = pd.read_excel(file, sheet_name='Sheet1')